Econometria Aplicada à Finanças
Aula 1

Mestrado Profissional em Administração

Prof. Washington Santos da Silva

IFMG - Campus Formiga

19 de agosto de 2025

Nesta Aula

Tópicos

  • Apresentações
  • Apresentação da Disciplina
  • Ambiente Computacional
  • Projeto RStudio para a Disciplina
  • Sessão sobre Sistema Quarto, RStudio, Linguagem R e Git/GitHub
  • Conheça e Utilize o Terminal Git Bash

Apresentações

Sobre o Professor

Washington Santos da Silva

Formação Acadêmica

  • Doutorado em Estatística e Experimentação Agropecuária (UFLA)
  • Mestrado em Estatística e Experimentação Agropecuária (UFLA)
  • Graduação em Ecomomia (UFMG)

Áreas de Interesse

  • Estatística e Econometria Aplicadas
  • Análise de Séries Temporais
  • Inferência Bayesiana

Experiência Profissional

  • Longa carreira na administração pública federal

Sobre Vocês

Breve apresentação

Por favor, se apresentem e expliquem seus objetivos ao cursar esta disciplina.

Apresentação da Disciplina

Por quê?

Motivação

Vamos começar com algumas questões básicas e gerais:

  1. Qual é o objetivo da econometria?
  1. Por que economistas (ou outros profissionais) estudam ou usam econometria?

Uma resposta simples: Para aprender sobre o mundo usando dados.

  • Aprender sobre o mundo = Formular e responder perguntas, formular e questionar teorias e suposições.

“Mundo das Finanças”

Agenda de Pesquisa em Finanças

  • Os mercados financeiros incorporam rapidamente e completamente as informações disponíveis? (Testa a hipótese de eficiência informacional dos mercados.)
  • O modelo CAPM ou os modelos multifatoriais (como o APT) explicam melhor a variação dos retornos dos ativos? (Comparação empírica de modelos de precificação de ativos.)
  • Quais características das empresas explicam a probabilidade de inadimplência ou default corporativo?
  • Quais fatores específicos de uma empresa explicam os níveis de ESG (ambiental, social e governança) divulgados por empresas?
  • Empresas com maior presença de mulheres na liderança apresentam desempenho financeiro superior?
  • O nível de governança corporativa das empresas está associado a menor custo de capital?
  • Quais características das empresas determinam a escolha entre financiamento via dívida ou emissão de ações?

“Mundo das Finanças”

Agenda de Pesquisa em Finanças

  • Quais fatores explicam a decisão de pagar dividendos entre empresas listadas?
  • Firmas com maior investimento em inovação (R&D) apresentam maior valor de mercado ajustado ao risco?
  • Quais determinantes explicam os níveis de spread de crédito cobrados em empréstimos corporativos?
  • Empresas com maior participação de investidores institucionais apresentam menor manipulação contábil?

O que?

O Que um Econometrista Aplicado Precisa Saber?

Um econometrista aplicado† precisa dominar (pelo menos) três áreas:

  1. A Teoria econômica.

  2. A Teoria Estatística/Econométrica (hipóteses, métodos, limitações).

  3. Como aplicar métodos teóricos a dados reais, o que exige conhecimento não trivial da teoria econômica e estatística/econométrica.

  4. Métodos eficientes para análisar dados— aquisição, transformação, junção, sumarização, visualização e modelagem \(\rightarrow\) fluência em linguagens de programação.

Esta disciplina visa aprofundar seu conhecimento nas últimas três áreas.

Site da Disciplina

Ambiente Computacional

Recursos

Instalação e Configuração dos Softwares

Por que usar a Linguagem R?

Modelo de Regressão Linear em STATA

* importa o arquivo de dados
use "trade.dta", clear

* cria nova variável 
replace distance = 5 if distance < 5

* Cria log das variáveis 
generate log_trade    = log(trade)
generate log_distance = log(distance)

* Regressão com EPs robustos à heterocedasticidade
reg log_trade log_distance, robust

Por que usar a Linguagem R?

Modelo de Regressão em R (base)

# importa o arquivo de dados
dados <- haven::read_dta("trade.dta")

# cria nova variável
dados$distance <- ifelse(dados$distance < 5, 5, dados$distance)

# Regressão linear com EPs robustos à heterocedasticidade
m1 <- lm(log(trade) ~ log(distance), data = dados)
lmtest::coeftest(m1, vcov = sandwich::vcovHC(m1, type = "HC1"))

# exibe o resultado
summary(m1)

Por que usar a Linguagem R?

Modelo de Regressão em Julia (Kezdi.jl)

# importa o arquivo de dados
@use "trade.dta"

# cria nova variável
@replace distance = 5 @if distance < 5

# Cria log das variáveis 
@generate log_trade = log(trade)
@generate log_distance = log(distance)

# Regressão linear com EPs robustos à heterocedasticidade
@regress log_trade log_distance, robust

Por que usar a Linguagem R?

Modelo de Regressão em Python

# carrega os módulos necessários
import pandas as pd
import math
import statsmodels.api as sm
import statsmodels.formula.api as smf

# importa o arquivo de dados
df = pd.read_stata("trade.dta")

# cria nova variável
df.loc[df["distance"] < 5, "distance"] = 5

# Cria log das variáveis 
df["log_trade"] = df["trade"].apply(math.log)
df["log_distance"] = df["distance"].apply(math.log)

# Regressão linear com EPs robustos à heterocedasticidade
modelo = smf.ols('log_trade ~ log_distance', data = df).fit(cov_type='HC3')
print(modelo.summary())

Por que usar a Linguagem R?

Motivos

1. R é gratuita e código aberto — economizando dinheiro tanto para você quanto para a instituicão 💰💵💰.

2. R é reconhecida e demandada no mercado.

3. R é muito flexível e poderosa—adaptável a quase qualquer tarefa, por exemplo, econometria, análise de dados espaciais, aprendizagem estatística/de máquina, web scraping, limpeza de dados…

4. Eu 💖 R

Nota: Aprender R, e qualquer outra linguagem ou sistema, definitivamente requer tempo e esforço.

Introdução ao RStudio

O que é o RStudio?

Um Ambiente de Desenvolvimento Integrado (Integrated Development Environment, IDE)

  • Ambiente de desenvolvimento que suporta múltiplas linguagens (R, Python, SQL, C++…), mas é especialmente útil para a linguagem R.

  • Facilita a escrita de código, gerenciamento de projetos, criação de documentos computacionais (arquivos quarto, scripts, notebooks…)

  • Integra ferramentas para desenvolvimento, depuração e publicação

Interface do RStudio

Figura 1: Interface do RStudio: 4 Painéis

Interface do RStudio

Painel Superior Esquerdo: - Editor de código - Documentos Quarto (.qmd) - Scripts R (.R)

Painel Inferior Esquerdo: - Console R (execução de comandos) - Terminal (acesso ao sistema)

Painel Superior Direito: - Ambiente (variáveis e objetos) - Histórico de comandos - Conexões - Git (controle de versão)

Painel Inferior Direito: - Arquivos - Pacotes - Ajuda - Visualização (gráficos, documentos HTML)

Pacotes/Bibliotecas R

Descrição

Pacotes (ou bibliotecas) são coleções organizadas de funções/dados e documentação que estendem as funcionalidades básicas da linguagem R.

Repositórios principais:

  • CRAN (Comprehensive R Archive Network): repositório oficial com mais de 20.000 pacotes verificados e testados, cobrindo estatística, econometria e ciência de dados

  • Bioconductor: repositório especializado em bioinformática e análise de dados genômicos, com padrões rigorosos de qualidade e documentação

Instalação de Pacotes R

Usando a função install.packages()

  • No console R do RStudio (atalho: Ctrl + 2), digite:
install.packages("tidyverse", "here", "fs")

Instalação de Pacotes R

Usando a Guia Packages

Para instalar pacotes usando a guia Packages no RStudio:

  • Clique na guia Packages.

  • Clique em Install Packages.

  • Digite o nome de cada pacote que deseja instalar separados por um espaço ou vírgula na caixa de texto, ou copie os pacotes abaixo e cole na caixa de texto:

tidyverse here fs

Projetos RStudio

O que são projetos RStudio?

  • Unidades organizacionais para seu trabalho
  • Cada projeto tem seu próprio diretório de trabalho
  • Facilita a organização de arquivos relacionados
  • Permite integração com controle de versão (Git)

Criando um projeto para a disciplina

Por que criar projetos estruturados?

  • Organização dos arquivos e códigos

  • Facilidade para compartilhar seu trabalho

  • Reprodutibilidade das análises

  • Integração com controle de versão

  • Prática recomendada

RStudio: Configurações Básicas

1. Definindo Git Bash como terminal padrão

  1. Considerando que você já tenha instalado Git for Windows, siga os passos abaixo:

  2. Clique em Tools → Global Options no menu superior

  3. Clique na aba Terminal, terceira de baixo para cima

  4. Na caixa New terminals open with, selecione Git Bash, em seguida, clique em Apply e depois em OK

  5. Agora, sempre que você abrir um terminal no RStudio, ele será o terminal do Git Bash, que é mais completo e funcional.

  6. Para abrir o terminal, clique na aba Terminal no painel inferior esquerdo do RStudio.

  7. Para verificar se o terminal está funcionando corretamente, digite git --version e pressione Enter. Você deve ver a versão do Git instalada.

RStudio: Configurações Básicas

2. Configurações básicas para Projetos RStudio

  1. Clique em Tools → Global Options no menu superior

  2. Na aba General, desmarque as seguintes opções:

  • Restore most recently opened project at startup
  • Restore previously opened files on startup
  • Restore .Rdata into workspace at startup
  • Em “Save workspace to .RData on exit”, selecione Never, em seguida, clique em Apply e depois em OK

Nota: A ideia é sempre começar com um ambiente limpo, sem objetos anteriores carregados.

Criando um projeto para a disciplina

Visão Geral

  • Vamos criar um projeto estruturado para a disciplina

  • O objetivo é criar uma estrutura padronizada para todos

Criando um projeto para a disciplina

Etapas do Processo

  1. Configurar Git localmente (em sua máquina)
  2. Criar repositório no GitHub
  3. Clonar repositório para sua máquina local
  4. Criar projeto RStudio a partir da pasta clonada
  5. Criar estrutura de pastas e adicionar arquivos
  6. Confirmar que tudo está pronto

Etapa 1: Configuração Local do Git

Configurando o Git Localmente

Antes de começar a usar o Git, é necessário fazer uma configuração inicial básica. Essa configuração identifica quem está fazendo as alterações e só precisa ser feita uma vez em cada computador.

Configure seu nome de usuário: Abra o Git Bash e;

  • Digite o comando:
git config --global user.name "nome_sobrenome"
  • Exemplo:
git config --global user.name "maria_silva"

Configure seu email:

  • Use o mesmo email que você usará (ou já usa) para sua conta no GitHub:
git config --global user.email "seu.email@exemplo.com"
  • Exemplo:
git config --global user.email "maria.silva@gmail.com

Verifique suas configurações globais:

  • Para conferir se tudo está correto:
git config --global --list

Anote seu nome de usuário e e-mail!

Etapa 2: Criando um Repositório no GitHub

2. Crie um Repositório no GitHub

  • Acesse sua conta no GitHub github.com, se não tiver, crie uma.

  • Selecione “Create repository

  • No campo abaixo de Repository name, digite o nome do repositório: “mpa_ecnt2025

  • NÃO USE acentos, espaços vazios ou caracteres especiais!

  • Agora, apenas clique em “Create repository”, no canto inferior esquerdo da página.

Etapa 2: Criando um Repositório no GitHub

Figura 2: Exemplo de um repositório vazio recém criando no GitHub

Etapa 3: Clonando o Repositório

Como obter o link do repositório para clonar?

  1. Vá para a página do seu repositório no GitHub

  2. Selecione o link exibido em URL HTTPS, copie o endereço utilizando botão direito do mouse e clicando em copiar:

https://github.com/SEU-USUARIO/mpa_ecnt2025.git

Etapa 3: Clonando o Repositório

3. Clone o Repositório (Windows)

Se você usa Windows:

  1. Defina/crie uma pasta em seu computador onde deseja guardar o projeto

  2. Navegue até essa pasta pelo Windows Explorer

  3. Clique com o botão direito do mouse em um espaço vazio e selecione “Git Bash Here

  4. No terminal Git Bash que abrir, digite git clone e cole o endereço do repositório clicando no botão direito do mouse e em Paste

git clone https://github.com/SEU-USUARIO/mpa_ecnt2025.git
  1. Verifique se a pasta foi criada usando o Windows Explorer.

Etapa 3: Clonando o Repositório

3. Clone o Repositório (Linux)

Se você usa Linux:

  1. Abra o terminal

  2. Navegue até a pasta onde deseja guardar o projeto usando o comando cd

  3. Digite git clone e cole o endereço do repositório em seguida:

git clone https://github.com/SEU-USUARIO/mpa_ecnt2025.git

Etapa 3: Clonando o Repositório

3. Clone o Repositório (MacOS)

Se você usa MacOS:

  1. Abra o terminal

  2. Navegue até a pasta onde deseja guardar o projeto usando o comando cd

  3. Digite git clone e cole o endereço do repositório em seguida:

git clone https://github.com/SEU-USUARIO/mpa_ecnt2025.git
  1. Verifique se a pasta foi criada usando o Windows Explorer.

Etapa 4: Criando um Projeto RStudio

4. Crie um Projeto RStudio usando a Pasta Clonada

  1. Abra o RStudio

  2. Clique em Project → New Project

  3. Selecione Existing Directory

  4. Clique em Browse e navegue até a pasta “visualizacao_dados_2025” que corresponde ao repositório que você acabou de clonar

  5. Selecione a pasta e clique em Open

  6. Clique em Create Project

  7. Projeto Criado!

Etapa 5: Criar Estrutura de Pastas do Projeto

Estrutura do Projeto

  • Vamos criar um projeto RStudio para a disciplina com a seguinte estrutura:
mpa_ecnt2025/          # raíz do projeto  
├── atividades         # atividades e avaliações
├── dados              # pasta para arquivos de dados
   ├── brutos         # arquivos originais 
   └── limpos         # dados processados
├── mpa_ecnt2025.Rproj # Arquivo do projeto RStudio
├── relatorios         # relatórios quarto (.qmd)
   ├── 01-relatorio   # pasta do relatorio 1
└── scripts            # scripts R (.R) 

Etapa 5: Criando a Estrutura de Pastas do Projeto

Com Git Bash

No terminal do RStudio, na raíz do seu projeto, execute:

  1. Crie a pasta dados:
mkdir dados
  1. Crie as subpastas “brutos” e “limpos”:
mkdir dados/brutos
mkdir dados/limpos
  1. Crie a Crie a pasta relatorios:
mkdir relatorios
  1. Crie a subpasta “01-relatorio
mkdir relatorios/01-relatorio
  1. Crie a pasta “scripts
mkdir scripts
  1. Crie a pasta “atividades
mkdir atividades

Etapa 5: Criando a Estrutura de Arquivos do Projeto

Baixe e Adicione o Primeiro Relatório

  1. Acesse a página Cronograma do site da disclina e baixe o arquivo 01-relatorio.zip

  2. Use o Windows Explorer para encontrar o arquivo baixado.

  3. Descompacte o arquivo anterior e copie/recorte o arquivo 01-relatorio.qmd

  4. Salve-o dentro da pasta “relatorios/01-relatorio

Descompactando arquivos ZIP

Como descompactar arquivos ZIP?

  • Windows: Clique com o botão direito no arquivo ZIP → Extract All

  • MacOS: Dê um duplo clique no arquivo ZIP (em versões atuais, um arquivo zip é automaticamente descompactado após o download)

  • Linux: Clique com o botão direito → Extract Here ou use o comando unzip no terminal

Etapa 5 pelo Terminal do RStudio

Com o Terminal do RStudio

  1. Baixar o arquivo .zip:
curl -L -O https://washingtonsilva.github.io/site_bach_visdados2025/arquivos/01-relatorio.zip
  1. Descompactar diretamente na pasta relatorios/01-relatorio/:
unzip 01-relatorio.zip -d relatorios/01-relatorio/
  1. Remover o arquivo zip:
rm 01-relatorio.zip
  1. Remove a pasta __MACOSX
rm -rf relatorios/01-relatorio/__MACOSX
  1. Verificar o resultado:
ls relatorios/01-relatorio/

Comando único:

curl -L -O https://washingtonsilva.github.io/site_bach_visdados2025/arquivos/01-relatorio.zip && unzip 01-relatorio.zip -d relatorios/01-relatorio/ && rm 01-relatorio.zip

Etapa 5: Criando a Estrutura de Arquivos do Projeto

Baixe e Adicione o Primeiro Relatório

  1. Acesse a página Cronograma do site da disclina e baixe o arquivo dados-simulados.zip

  2. Use o Windows Explorer para encontrar o arquivo baixado.

  3. Descompacte o arquivo anterior e copie/recorte o arquivo dados-simuilados.csv

  4. Salve-o dentro da pasta “dados/brutos

Etapa 5 pelo Terminal do RStudio

Com o Terminal do RStudio

curl -L -O https://washingtonsilva.github.io/site_bach_visdados2025/arquivos/dados-simulados.zip && unzip dados-simulados.zip -d dados/brutos/ && rm dados-simulados.zip

Etapa 5: Criando a Estrutura de Pastas do Projeto

Verificando o Projeto

Seu projeto deve ter uma estrutura similar à seguinte (mais arquivos irão aparecer):

mpa_ecnt2025/          
├── atividades
├── dados
   ├── brutos
   └── limpos
├── mpa_ecnt2025.Rproj
├── relatorios
   └── 01-relatorio
       └── 01-relatorio.qmd
└── scripts

Você pode verificar a estrutura do seu projeto usando a função dir_tree() do pacote fs.

Digite no console R:

fs::dir_tree()

Projeto Criado!

Parabéns!!! 👏

  • Você acaba de criar um projeto estruturado para a disciplina

  • Esta estrutura organizará nosso trabalho ao longo do semestre

  • Nos próximos encontros, aprenderemos a utilizar o RStudio,Sistema Quarto, R, Git e GitHub para análise de dados

Arquivo README.md

Definição e importância

  • É um arquivo de documentação em formato Markdown que serve como porta de entrada para seu repositório.

  • Normalmente, é o primeiro arquivo que as pessoas visualizam ao acessar seu repositório no GitHub.

  • Funciona como a “página inicial” do seu projeto, explicando:

    • O que é o projeto
    • Como utilizá-lo
    • Como ele está organizado
    • Outras informações relevantes
  • Benefícios para a disciplina:

    • Documenta seu trabalho de forma organizada
    • Facilita a avaliação do professor
    • Serve como portfólio para seu aprendizado
    • Desenvolve boas práticas de documentação

Como criar um arquivo markdown no RStudio?

Passos

No menu superior do RStudio clique em:

  • File -> New File -> Markdown File

  • Salve o arquivo com o nome README.md na raíz do seu projeto RStudio.

Template README.md para seu Projeto

# Mestrado Profissional em Administração 

## Disciplina: Econometria Aplicada à Finanças 

Repositório pessoal da disciplina **Econometria Aplicada à Finanças** (60h) 
ofertada pelo Mestrado Profissional em Administração do IFMG – Campus Formiga. 

Este repositório consiste em um projeto RStudio que será utilizado para 
desenvolver as atividades práticas da disciplina, incluindo a criação de 
relatórios quarto, scripts R, entre outros.

README.md = “Diário de bordo”

Como manter seu README atualizado

  • Atualize o README.md à medida que a disciplina e o seu conhecimeto avançam
  • Utilize este arquivo como um “diário de bordo” do seu aprendizado
  • Adicione detalhes sobre desafios superados e soluções encontradas

Recursos

Introdução ao Git e GitHub

O que é Git?

Um sistema de controle de versão

  • Um “sistema de salvamento inteligente” que registra cada versão dos seus documentos.

  • Armazena apenas as mudanças entre versões, economizando espaço.

  • Funciona como uma “máquina do tempo” para seu trabalho.

  • Facilita o trabalho em equipe sem conflitos graves.

Comandos essenciais do Git

Comandos Essenciais

Os quatro comandos básicos que você usará com mais frequência (seu fluxo de trabalho padrão no Terminal do RStudio) são:

  • git status: consulta o estado atual dos seus arquivos
  • git add: prepara as mudanças para serem salvas
  • git commit: salva as mudanças no repositório local
  • git push origin main: envia as mudanças para o GitHub

Pense nestes comandos como um processo de 4 passos:

  1. Verificar o que mudou (status).
  2. Adicionar/Selecionar o que você quer salvar (add).
  3. Salvar as mudanças localmente com uma descrição (commit).
  4. Enviar para a nuvem/GitHub (push).

O que é GitHub?

Uma plataforma colaborativa baseada em Git

  • “Nuvem para projetos Git” - armazena seus repositórios online
  • Facilita compartilhamento e colaboração em projetos
  • Oferece ferramentas para revisão de código, discussão e documentação
  • Funciona como um portfólio para profissionais e estudantes

Fluxo de trabalho com Git e GitHub

Figura 3: Fluxo de trabalho Básico

Por que ignorar arquivos no Git?

Arquivos Desnecessários

Arquivos temporários ou gerados automaticamente

  • .Rhistory, .RData: Histórico e dados da sessão do R.
  • _cache/: Arquivos de cache que podem ser recriados.
  • .Rproj.user/: Configurações pessoais do RStudio.

Arquivos específicos do sistema operacional

  • Thumbs.db, .DS_Store: Arquivos de metadados do Windows/Mac.

Arquivos de saída/resultados

  • Documentos gerados (pdf…): São resultado do código, não o código em si.

  • Podem ser muito grandes, mudar frequentemente.

Copie/Cole no arquivo .gitignore do seu projeto

# Arquivos de sistema do Windows
Thumbs.db
Desktop.ini

# Arquivos de sistema do MacOS
.DS_Store

# Arquivos do RStudio
.Rproj.user/
.Rhistory
.RData
.Ruserdata

# Arquivos temporários R
*_cache/
/cache/

# Arquivos de saída
*.pdf
*.html


# Arquivos temporários
*~
.~lock.*
*.tmp
*.bak

Benefícios de um bom .gitignore

Descrição

  • Repositórios mais limpos e leves

    • Menos arquivos = downloads e operações mais rápidas
    • Evita ocupar espaço com arquivos regeneráveis
  • Evita conflitos desnecessários

    • Arquivos de configuração pessoal causariam conflitos entre colaboradores
    • Arquivos binários (PDF, imagens) são difíceis de resolver em conflitos
  • Mantém o foco no que importa

    • Apenas o código-fonte e dados essenciais são versionados
    • Facilita a revisão de mudanças significativas

Publicando o Projeto RStudio no GitHub

Sincronizando o repositório local com o GitHub

  • Para publicar seu projeto RStudio no GitHub, você deve usar a seguinte sequência de comandos no terminal do RStudio:
  1. No terminal do RStudio, verifique quais arquivos/pastas foram modificados ou criados com:
git status
  1. Você pode adicionar todos os arquivos de uma vez com:
git add .
  1. Execute git status novamente para confirmar que todos os arquivos foram adicionados (aparecerão em verde sob “Changes to be committed”):
git status
  1. Se tudo estiver em verde, faça um commit com uma mensagem descritiva:
git commit -m "primeiro commit do projeto"
  1. Se algum arquivo ou pasta ainda aparecer em vermelho após o segundo git status, adicione as pastas/arquivos um por um:
git add relatorios/01-relatorio/01-relatorio.qmd
  1. Execute git status novamente e faça o commit quando todos os arquivos estiverem em verde:
git commit -m "primeiro commit do projeto"
  1. Envie/Sincronize o repositório local atualizado para o GitHub:
git push origin main

Publicando o Projeto RStudio no GitHub

Vá até seu repositório no GitHub

  • Atualize a página do seu repositório no GitHub (F5)

  • Verifique se os arquivos foram enviados corretamente

  • Se tudo estiver correto, você verá a estrutura de pastas e arquivos que criou no RStudio

Boas práticas

Descrição

  • Versionando o que é importante

    • Código-fonte (arquivos .R, .py, .qmd)
    • Dados brutos (se não forem muito grandes)
    • Documentação (.md, README)
  • Ignorando o que é regenerável

    • Resultados que podem ser recriados executando o código
    • Configurações específicas do ambiente de cada usuário
    • Arquivos temporários e de cache

Recursos adicionais

Introdução ao Sistema de Publicação Quarto

O que é o sistema de publicação Quarto?

Definição

  • É um sistema de publicação científica e técnica de código aberto que une texto narrativo e código para produzir documentos elegantemente formatados.

  • Com o Quarto, você pode criar diversos produtos:

    • Relatórios (html, pdf, docx )
    • Apresentações (RevealJS, Beamer,…)
    • Dashboards, websites, blogs e livros

O que é o sistema de publicação Quarto?

Figura 4: Sistema Quarto: um formato, diversos produtos.

Como funciona o Quarto?

Figura 5: Funcionamento do Sistema Quarto com a linguagem R.

Definição

  • Quando você renderiza um arquivo Quarto (que possui a extensão .qmd) contendo código R, primeiro o pacote knitr da linguagem R executa todas as células de código R e cria um novo arquivo markdown (.md), que inclui o código e sua saída.

  • O arquivo markdown gerado é então processado pelo programa pandoc, que gera o formato escolhido.

  • O botão Render do Rstudio encapsula essas ações e as executa na ordem correta para você.

Sistema Quarto e RStudio

Integração com RStudio

No RStudio, você pode criar e editar arquivos Quarto facilmente:

  • File → New File → Quarto Document/Presentation
  • Botão “Render” para renderizar o arquivo.

Por que usar o sistema Quarto?

Principais benefícios

  • Reprodutibilidade: Documenta todo o processo de análise de dados, garantindo que seu trabalho possa ser reproduzido.

  • Integração de código e narrativa: Combina texto explicativo, código e resultados em um único documento.

  • Múltiplos formatos de saída: Gera diferentes formatos (html, pdf, docs, apresentações) a partir do mesmo arquivo fonte.

  • Atualizações automáticas: Ao modificar dados ou código, basta renderizar o documento para atualizar todos os resultados.

Anatomia de um Arquivo Quarto

Anatomia de um Arquivo Quarto

Nota

Um arquivo Quarto (.qmd) consiste de três elementos fundamentais:

  1. Metadados (YAML): Controla o formato e opções do documento
  2. Texto em Markdown: O conteúdo narrativo do documento
  3. Células de Código: Código executável com suas opções

Metadados (YAML)

---
title: "Análise de Vendas"
author: "Seu Nome"
format: 
  html:
    toc: true
    theme: cosmo
execute:
  echo: true
  warning: false
---

Atenção à indentação!

  • A sintaxe YAML é sensível à indentação
  • Use sempre 2 espaços para aninhar elementos
  • Erros de indentação são a causa mais comum de problemas

Texto em Markdown

Código Markdown:

# Título da seção

Este é um parágrafo com **texto em negrito** e *itálico*.

- Item da lista
- Outro item
  - Subitem

[Link para tutorial](https://website.com)

Tutorial sobre Markdown

Tutorial completo

Acesse o tutorial sobre Markdown para mais detalhes.

Células de Código

Exemplo de célula de código R básica:

```{r}
# cria um vetor numérico de 1 a 10
x <- 1:10

# calcula a média amostral
mean(x)
```

O resultado é:

[1] 5.5

Células de Código

Como inserir células de código quarto no RStudio?

Você pode adicionar uma célula de código de três maneiras:

  1. Usando o atalho de teclado: Ctrl+Alt+I (Windows/Linux) ou Cmd+Option+I (Mac).

  2. Clicando no ícone CInsert a new code chunk” na barra superior de ferramentas do RStudio e selecionando “R”.

  3. Digitando manualmente os delimitadores de célula: ```{r} e `````.

Células de Código

Exemplo de célula de código R com opções:

```{r}
#| echo: true
#| warning: false
#| message: false

# Esta célula mostrará o código (echo: true), 
# mas ocultará avisos (warning) e mensagens
library(dplyr)
mtcars %>% 
  group_by(cyl) %>%
  summarise(
    n = n(),
    mpg_média = mean(mpg, na.rm = TRUE)
  )
```

Células de Código

O resultado do código anterior é:

# A tibble: 3 × 3
    cyl     n mpg_média
  <dbl> <int>     <dbl>
1     4    11      26.7
2     6     7      19.7
3     8    14      15.1

Figura com legenda

# Gráfico de dispersão entre consumo (hwy) e potência (displ)

# cria um sistema de coordenadas e elementos estéticos básicos
ggplot(ggplot2::mpg, aes(x = displ, y = hwy)) +
  # cria um gráfico de dispersão
  geom_point() +
  # aplica um tema minimalista 
  theme_minimal() +
  # define títulos e rótulos dos eixos
  labs(title = "Consumo de Combustível x Potência do Motor",
       x = "Cilindrada do Motor",
       y = "Milhas por Galão")

Figura com legenda

Figura 6: Gráfico de dispersão entre consumo e potência do motor.

Opções comuns para células de código

Opção Descrição Exemplo
echo Mostrar o código? #| echo: true
eval Executar o código? #| eval: true
warning Mostrar avisos? #| warning: false
message Mostrar mensagens? #| message: false
label Identificador único para uma figura #| label: fig-analise
fig-cap Legenda da figura #| fig-cap: "Gráfico de dispersão"

Opções comuns para células de código

Configuração global

Defina opções de código para todo o documento no YAML:

execute:
  echo: false
  warning: false
  message: false

Demonstração no RStudio

Vamos à prática!

Agora vamos ver um documento Quarto em ação no RStudio:

  • Abra o arquivo 01-relatorio.qmd

Recursos para Aprendizagem

Tutorial e Guia de Consulta Rápida

Sessão sobre Sistema Quarto, RStudio + Git Bash, Linguagem R e Git/GitHub

Sessão Interativa

Conhecendo as Ferramentas

  • Abram o arquivo relatorios/01-relatorio/01-relatorio.qmd

Conheça e Utilize o Terminal Git Bash

Por que usar o Terminal (Shell)?

Motivos

Nesta seção, vamos explorar o terminal Git Bash integrado ao RStudio.

Por que usar o terminal?

  • Eficiência: Automatize tarefas repetitivas com comandos simples.
  • Reprodutibilidade: Documente cada passo do seu trabalho em scripts.
  • Controle: Tenha acesso direto a ferramentas poderosas como o Git.
  • Padrão da Indústria: Uma habilidade fundamental em ciência de dados e desenvolvimento de software.

Criando e Organizando

Comandos Básicos

O terminal torna a organização do projeto rápida e transparente.

  • mkdir <nome_pasta>: Cria uma nova pasta.
  • touch <nome_arquivo>: Cria um arquivo vazio.
  • mv <origem> <destino>: Move ou renomeia um arquivo/pasta.
  • cp <origem> <destino>: Copia um arquivo/pasta.

Exemplo: Vamos criar uma pasta para uma nova atividade.

# Voltando para a raiz do projeto
cd ~

# Criando a pasta da atividade 01
mkdir atividades/01-atividade

# Criando um rascunho para o script da atividade
touch atividades/01-atividade/rascunho.qmd

Inspecionando Arquivos

Comandos Básicos

Antes de carregar um conjunto de dados no R, você pode inspecioná-lo rapidamente.

  • head <arquivo>: Mostra as 10 primeiras linhas.
  • tail <arquivo>: Mostra as 10 últimas linhas.
  • wc -l <arquivo> (word count): Conta o número de linhas.

Exemplo: Vamos inspecionar nossos dados simulados.

# Navegue até a pasta de dados brutos
cd dados/brutos

# Veja o início do arquivo
head dados_simulados.csv

# Conta o numero de linhas
wc -l dados_simulados.csv

O Operador “Pipe”

O “pipe” (|)

O “pipe” (|) é um dos conceitos mais poderosos do terminal. Ele permite que você “conecte” a saída de um comando à entrada de outro.

Formato: comando1 | comando2

Exemplo: Listar todos os arquivos e mostrar apenas os 5 primeiros.

# Voltando para a raiz do projeto
cd ~

# O comando ls -R lista arquivos de forma recursiva
ls -R | head -n 5

Isso nos dá uma visão rápida da estrutura do projeto sem poluir a tela

Removendo Arquivos e Pastas

Comandos Básicos

É possível remover arquivos e pastas diretamente pelo terminal. Use com cautela!

  • rm <arquivo> (remove): Remove um arquivo.
  • rmdir <pasta_vazia> (remove directory): Remove uma pasta vazia.
  • rm -r <pasta> (remove recursive): Remove uma pasta e todo o seu conteúdo. Este comando é perigoso e não tem volta!

Recomendação: Para remover, prefira a interface gráfica do RStudio ou do seu sistema operacional, especialmente no início.

Download de Arquivos

Comando curl e operador &&

Vamos aprender a baixar arquivos da web e a executar comandos em sequência.

  • curl -O <URL>: Baixa um arquivo da internet e o salva com o mesmo nome no diretório atual.
  • comando1 && comando2: O operador && (E lógico) executa o comando2 apenas se o comando1 for bem-sucedido (terminar sem erros).

Exemplo Prático: Baixar um arquivo de dados e, em seguida, listar o conteúdo da pasta para confirmar o download.

# Navegue até a pasta de dados brutos, se ainda não estiver lá
cd dados/brutos

# Baixa o arquivo e, se o download funcionar, lista o conteúdo da pasta
curl -O https://raw.githubusercontent.com/datasciencemasters/go-datascience/master/data-raw/ibov.csv && ls

Download de Arquivos

Exemplo Avançado

Operação: Baixar, descompactar e limpar.

Este padrão é muito comum para configurar projetos:

  1. curl -L -O <URL>: O -L segue redirecionamentos de URL, garantindo que você baixe o arquivo do local correto.
  2. unzip <arquivo.zip> -d <pasta>: Descompacta o arquivo em uma pasta específica.
  3. rm <arquivo.zip>: Remove o arquivo .zip após a extração, mantendo o projeto limpo.
# Baixa, descompacta para a pasta do relatório e remove o .zip
curl -L -O https://washingtonsilva.github.io/site_bach_visdados2025/arquivos/01-relatorio.zip && unzip 01-relatorio.zip -d relatorios/01-relatorio/ && rm 01-relatorio.zip

Resumo e Próximos Passos

Resumo

O que vimos:

  • Navegar entre pastas (pwd, ls, cd).
  • Criar e organizar o projeto (mkdir, touch, mv).
  • Inspecionar dados rapidamente (head, wc).
  • Combinar comandos com o “pipe” (|).
  • Remover arquivos e pastas (rm, rmdir, rm -r).
  • Baixar arquivos da internet e executar comandos em sequência (curl, &&).

Próximos passos:

O terminal é uma ferramenta que, com a prática, pode ser tornar uma grande aliada na organização e automação do seu trabalho, fortalecendo a reprodutibilidade de suas análises.

Referências

WICKHAM, H. et al. R for data science: import, tidy, transform, visualize, and model data. 2. ed. [s.l.] O’Reilly Media, Inc, 2023.